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Procede de traitement d'un^ s equence aoxiore, tell^ 
morceau musical 

La pr^sente invention concerne le traitement d'une 
sequence sonore, telle qu-un morceau de musique ou, de 
faqron plus generale, une sequence sonore comportant la 
repetition d'une sous - sequence . 

Les distributeurs de productions musicales, par exemple 
enregistrees sur CD, cassette ou autre support, mettent a 
la disposition des clients potentiels des kiosques oil les 
clients peuvent €couter une musique de leur choix, ou 
encore des musiques promues en raison de leur nouveautg. 
Lorsqu'un client reconnait un couplet ou un refrain du- 
morceau musical qu'il 6coute, il peut decider d'acheter la; 
production musicale correspondante . 

De fa^on plus g^ngrale, un auditeur d- attention moyenhe' 
concentre davantage son attention sur un enchainement de 
couplet et refrain, que sur 1 • introduction du morceau, 
notamment. On comprendra ainsi qu'un r^sumg sonore 
comportant au moins un couplet et un refrain suffirait 
pour etre diffuse dans des kiosques du type precit^, 
Plut6t que prevoir la production musicale complete ^ 
25 diffuser. 

Dans une autre application telle que la transmission de 
donnges sonores par telephonie mobile, on comprendra que 
le t616chargement du morceau de musique complet sur un 
30 terminal mobile, a partir d'un serveur distant, est 
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beaucoup plus long et, de la, plus onereux que le 
telechargement d'un resume sonore du type precite. 

De m@me, dans un contexte de commerce electronique, des 
resumes sonores peuvent §tre telecharges sur un poste 
communiquant avec un serveur distant, via un r6seau etendu 
du type INTERNET* L 'utilisateur du poste informatique peut 
ainsi passer commande d'une production musicale dont il 
apprScie le r6sum6 sonore. 

Toutefois, d^tecter a I'oreille \xn couplet et un refrain 
et creer ainsi un resume sonore pour toutes les 
productions musicales distributes serai t une ttche d'une 
lourdeur prohibitive. 

La presente invention vient ameliorer la situation. 

L'lan des buts de la presente invention est de proposer une 
detection automatisee d'une sous-s6quence repetee dans une 
sequence sonore . 

Un autre but de la present e invention est de proposer une 
creation automatisee de rtsumSs sonores du type decrit ci- 
avant . 

A cet effet, la presente invention porta d'abord sur un 
proc6d§ de traitement d'une sequence sonore, dans lequel : 
a) on applique une transformte spectrale k ladite sequence 
pour obtenir des coefficients spectraux variant en 
fonction du temps dans ladite sequence. 



Le proc^dg au sens de !• invention comporte en outre les 
Stapes suivantes : 

b) on determine, par analyse statist ique desdits 
coefficients spectraux, au moins une sous-sequence repgtee 
dans ladite sequence, et 

c) on lvalue des instants de debut et de fin de ladite 
sous -sequence dans la sequence sonore. 

Avantageusement, selon une etape supplement aire : 

d) on extrait la sous-sequence prgcitSe pour stocker, dans 
une memoire, des gchantillons sonores repr^sentant ladite 
SOUS ^ Sequence , 

PrSferentiellement, 1- extraction de I'etape d) conceme au. 
moins une sous-sequence dont la dur^e est la plus- 
importante et/ou une sous-sSquence dont la frequence de'. 
repetition est la plus importante dans ladite sequence. 

La presents invention trouve une application avantageuse 
dans l.aide ^ la detection de defaillances de machines 
xndustrielles ou de moteurs, notamment en obtenant des 
sequences d ■ enregistrement sonore de phases d • acceleration 
et de deceleration du regime moteur. L • application du 
precede au sens de 1' invention permet d-isoler une sous- 
sequence sonore correspondant par exemple a un plein 
regime ou ^ une phase d' acceleration, cette sous-sequence 
etant, le cas echeant, comparee a une sous-sequence de 
reference . 



Dans une autre application avantageuse a I'obtention de 
donnees musicales du type decrit ci-avant, la sequence 
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sonore precitee est un morceau de musique comportant une 
succession de sous -sequences parmi au moins une 
introduction, un couplet, un refrain, un pont de 
transition, un thSme, un motif, ou un mouvement qui se 
repute dans la sequence. 

A I'etape c) , on determine pr6f ^rentiellement au moins les 
instants respectifs de d6but et de fin d'une premiere 
sous -sequence et d'une seconde sous - sequence • 

Dans une realisation particulidrement avantageuse, a 
1 » etape d) , on extrait alors une premiere et une seconde 
sous-sequence pour obtenir, sur un support m^moire, un 
resume sonore dudit morceau de musique comportant au moins 
la premiere sous -sequence enchainee avec la seconde sous- 
sequence . 

Pr6ferentiellement, la premiere sous -sequence correspond a: 
un couplet et la seconde sous -sequence correspond a un 
refrain. 

Toutefois, il pent advenir que des premiere et seconde 
sous -sequences, extraites d'une sequence sonore, ne soient 
pas contigues dans le temps. 

A cet effet, on prevoit en outre les etapes suivantes : 
dl) detect er au moins une cadence de la premiere sous- 
sSquence et/ou de la seconde sous -sequence pour estimer la 
duree moyenne d'une mesure ^ ladite cadence, ainsi qu'au 
moins un segment de fin de la premiere sous -sequence et au 
moins un segment de debut de la seconde sous -sequence, de 
durees respect ives correspondant sensiblement & ladite 
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aur^e moyenne et isol6s dans la sequence d'un nombre 
entier de dur^es moyennes, 

d2) ggn^rer au moins \me mesure de transition de duree 
correspondant a ladite dur6e moyenne et comportant une 
addition des 4chantillons sonores d'au moins ledit segment 
de fin et d'au moins ledit segment de d€but, 
d3) et concatgner la premiere sous -sequence, la ou les 
mesures de transition et la seconde sous-s6quence pour 
obtenir 1 • enchainement de la premiere et de la seconde 
sous - sequence . 

On constatera que la succession des Stapes dl) k d3) 
trouve, au-deia de. la generation automat ique de r^sum^s 
sonores, une application avantageuse a la creation 
musicale assist^e par ordinateur. Dans cette application, 
un utilisateur peut cr^er lui-mgme deux sous -sequences 
d'un morceau musical, tandis qu'un logiciel comportant des" 
instructions pour dgrouler les Stapes dl) a d3) assure un 
enchainement des deux sous -sequences par concatenation, 
sans artefact et agr^able a I'oreille. 

De fa(?on plus generale, la pr^sente invention vise aussi 
un produit programme d- ordinateur, stocks dans une mSmoire 
d- ordinateur ou sur un support amovible propre a coopgrer 
avec un lecteur homologue d • ordinateur , et comportant des 
instructions pour dSrouler les gtapes du procgde au sens 
de 1 ' invention. 

D'autres caractgristiques et avantages de 1 • invention 
apparaitront a l-examen de la description dgtailiee ci- 
aprds, et des dessins annexes sur lesquels : 



6 

la figure la represente un signal audio d*un morceau 
de musicjue correspondant , dans 1' example represente, 
a une chanson de variete ; 

la figure lb represente la variation d*6nergie 
spectrale en fonction du temps, pour le morceau de 
musique dont le signal audio est represent^ sur la 
figure la ; 

la figure Ic illustre les durees occupies par les 
diffSrents passages du morceau de musique de la 
figure la et qui se r^pStent dans ce morceau ; 
la figure 2 represente schematiquement des fenStres 
temporelles select ionn€es dans deux parties 
respectives du morceau musical pour preparer la 
concatenation de ces deux parties, selon la 
succession des etapes dl) & d3) ci-avant ; 
la figure 3a represente schematiquement des segments 
Si(t) et Sj(t) sSlectionnes dans les parties 
respectives du morceau precitees, pour preparer une 
concatenation des deux parties par super- 
position/addition ; 

la figure 3b illustre schematiquement par le signe 

la superposition/addition precit6e ; 
la figure 4 illustre une fenStre temporelle pour la 
concatenation precitee, de forme et de largeur 
prSfSrees ; et 

la figure 5 represente un organigramme de traitement 
d'une sequence sonore, dans un mode de realisation 
prefere de la presente invention. 



signal audio de la figure la represente I'intensite 
:>re (en ordonnees) en fonction du temps (en abscisses) 



d'un morceau musical (ici, le morceau "head over feet"® de 
1- artiste Alanis Morissette) . Pour construire ce signal 
audio, les signaux respectifs des voies droite et gauche 
(en mode st^rgophonique) ont 6te synchronises et 
additionngs . 

Au signal audio repr^sente sur la figure la, on applique 
une transformee spectrale (par exemple de type transform^e 
de Fourier rapide FFT) pour obtenir une variation 
temporelle de 1 - ^nergie spectrale du type represents sur 
la figure lb. 



Dans un mode de realisation, il s'agit d-une pluralite de 
FFT a court terme, successives, dont le rgsultat est 
applique a un banc de filtres sur plusieurs gammes de 
frequences (pref grentiellement de largeurs de band^. 
croissantes comme le logarithmique de la frequence). Une' 
autre transformee de Fourier est ensuite appliquee pour 
obtenir des paramdtres dynamiques du signal audio 
(references PD sur la . figure lb) . En particulier 
I'Schelle en ordonnees de la figure lb indigue 1' amplitude 
des variations des composantes a differentes vitesses dans 
un domaine de frequences donne . Ainsi, 1 ' indice 0 ou 2 de 
I'Schelle arbitraire en ordonnees de la figure lb 
correspond a une variation lente dans les basses 
frequences, tandis que 1 ' indice 12 de cette mgme echelle 
correspond a une variation rapide dans les hautes 
frequences. Ces variations sont exprimSes en fonction du 
temps, en abscisses (secondes) . Les intensites associees & 
ces param^tres dynamiques PD, au cours du temps, sont 
illustrees par differents niveaux de gris dont les valeurs 
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relatives sont indiquees par la colonne de reference COL 
(a droite de la figure lb) . 

On indique que les param^tres dynamiques du type 
represents sur la figure lb permettent d* identifier 
completement un morceau de musique. Dans ce contexte 
d» "exnpreinte" d'un morceau de musique, la demande PR- 
2834363 de la Demanderesse dScrit de fagon dStaillSe ces 
paramdtres et la maniSre de les obtenir. 

En variante, les variables dSduites du signal audio et 
permettant de caractgriser le morceau de musique peuvent 
etre de type different, notamment des coefficients dits 
"Mel Frequency Cepstral Coefficients" . Globalement, on 
indique que ces coefficients (connus en soi) sont encore 
obtenus par transformee de Fourier rapide, a court terme. 

La figure Ic offre une representation visuelle de 
1' evolution de I'energie spectrale de la figure lb. Sur la 
figure Ic, I'abscisse repr§sente le temps (en secondes) et 
les ordonnSes representent les diffSrentes parties du 
morceau, tels que les couplets, les refrains, 
1 ' introduction, un th^me, ou autres . La repetition au 
cours du temps d'une partie similaire, tel qu*un couplet 
ou un refrain, est representee par des rectangles grists 
qui apparaissent a diffSrentes abscisses dans le temps (et 
qui peuvent §tre de largeurs temporelles dif fSrentes) , 
mais de m§me ordonnees. Pour passer de la representation 
de la figure lb a la representation de la figure Ic, on 
met en ceuvre une analyse statistique en utilisant par 
exemple 1 ' algorithme des K - means " , ou encore 1 ' algorithme 



"FUZZY K-means", ou encore une chalne de Markov cachee, 
avec un apprentissage par 1 • algorithme BAUM-WELSH, suivi 
d'une Evaluation par 1 ' algorithme de VITERBI. 

Typiquement, la determination du nombre d'6tats (les 
parties du morceau de musique) qui sont n^cessaires a la 
representation d'un morceau de musique s'effectue de fagon 
automat isee, par comparaison de la similarity des etats 
trouves ^ chaque iteration des algorithmes precit^s, et en 
gliminant les etats redondants. Cette technique, dite de 
"pruninsr" permet ainsi d'isoler chaque partie redondante 
du morceau de musique et de determiner ses coordonnSes 
temporelles (ses instants de debut et de fin, comme 
indiqu6 ci-avant) . 

•1 

Ainsi, on Etudie les variations, par exemple dans le^ 
frequences tonales (d'une voix humaine) , de 1 -Energie 
spectrale pour determiner la repetition d'un passage 
musical particulier dans le signal audio. 

Preferentiellement, on cherche a extraire un ou plusieurs 
passages musicaux dont la duree est la plus importante 
dans le morceau de musique et/ou dont la frequence de 
repetition est la plus importante. 

Par exemple, pour la plupart des morceaux de variete, on 
pourra choisir d'isoler les parties de refrain, dont la 
repetition est gEneralement la plus frequents, puis les 
parties de couplet, dont la repetition est frequente, 
puis, le cas echeant, d'autres parties encore si elles se 
repetent . 
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On indique que d'autres types de sous -sequences 
representatives du tnorceau de musique peuvent etre 
extraites, des lors que ces sous -sequences se repetent 
dans le morceau de musique. Par exetnple, on peut choisir 
d'extraire un motif musical, g^n^ralement de plus courte 
durSe qu'un couplet ou un refrain, tel qu^un passage de 
percussions rep6t6 dans le morceau de musique, ou encore 
une phrase vocale scand^e plusieurs fois dans le morceau - 
En outre, un thdme peut aussi etre extrait du morceau de 
musique, par exemple une phrase musicale repetee dans un 
morceau de jazz ou de musique classique. En musique 
classique, un passage tel qu'un mouvement peut en outre 
etre extrait . 

Sur le resumg visuel represent e a titre d' exemple sur la 
figure Ic, les rectangles grises indiquent la presence 
d'une partie du morceau telle que 1 ' introduction 
("Intro")/ d'un couplet ou d'un refrain dans une fenetre 
temporelle indiqu^e par I'abscisse temporelle (en 
secondes) , Ainsi, entre 0 et environ 15 secondes, le 
morceau de musique dSmarre par une introduction (index^e 
par le chiffre 2 sur l«gchelle en ordonn^es) . 
L ' introduction est suivie de deux alternances de couplet 
(indexe par le chiffre 3) et de refrain (indexe par le 
chiffre 1) jusqu'aL environ 100 secondes. 

On se r^fSre maintenant k la figure 5 pour decrire les 
etapes principales du proc6d# pour obtenir le rSsumS 
sonore precit^, selon un mode de realisation pr^f^r^. Tout 
d'abord, on obtient les signaux audio sur la voie gauche 
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■"audio L" et sur la voie droite "audio R» aux Stapes 
respectives 10 et 11, lorsque la sequence sonore initiale 
est repr^sentge en mode stgr^ophonique . Les signaux de ces 
deux voles sont additionn^s k I'etape 12 pour obtenir un 
signal audio du type reprgsente sur la figure la. Ce 
signal audio est, le cas ech^ant, stocky sous forme 
6chantillonnge dans une memoire de travail avec des 
valeurs d'intensite sonores rang^es en fonction de leurs 
coordonnees temporelles associSes (etape 14) . A ces 
donnees audio, on applique une transformge spectrale (de 
type FFT dans I'exemple reprgsent^) , ^ 1-gtape 16, pour 
obtenir, a I'gtape 18, les coefficients spectraux Fi(t) 
et/ou leur variation APi(t) en fonction du temps. A 
I'^tape 20, un module d'analyse statistique opdre sur la 
base des coefficients obtenus k 1 ' €tape 18 pour isoler des 
instants to,ti,..„t7 qui correspondent k des instants de 
d§but et de fin des diff#rentes sous -sequences qui se' 
r^pdtent dans le signal audio de 1' etape 14. 

Dans I'exemple represents, le morceau de musique pr^sente 
une structure (classique en variete) du type comportant : 

- une introduction dans le debut du morceau entre un 
instant to et un instant ti, 

- un couplet entre ti et ta, 

- un refrain entre tz et tj, 

- un second couplet entre ta et t4, 

- un second refrain entre t4 et ts, 

- une introduction, k nouveau, le cas Schgant 
agr^mentge d'un solo instrumental, entre les instants 
ts et ts, et 
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- la repetition de deux refrains de fin de morceau 
entre les instants tg et t?. 

A I'etape 22, les instants to ^ t? sont repertories et 
indexes en fonction du passage musical correspondant 
(introduction, couplet ou refrain) et stockes, le cas 
echgant, dans vine mStnoire de travail. A I'gtape 23, on 
peut construire alors un resume visuel de ce morceau de 
musique, tel que reprSsentg sur la figure 5. 

Dans I'exemple decrit ci-avant d'un morceau de vari^Stg 
comportant une structure typique, on construit le resume 
sonore a partir d»un couplet extrait du morceau, suivi 
d'un refrain extrait du morceau. A. I'etape 24, on prepare 
une concatenation des echantillons, sonores du signal audio 
entre les instants ti et t2. d»une part, et entre les 
instants t2 et tg, d' autre part, dans I'exemple decrit. Le 
cas echeant, le resultat de cette concatenation est 
memorise dans une m^moire permanente MEM pour une 
utilisation ult^rieure, a I'etape 26. 

Toutefois, en rSgle g^nerale, 1 ' instant de fin d'un 
couplet isole et 1 ' instant de dSbut d'un refrain isol6 ne 
sont pas forcSment identiques, ou encore, on peut choisir 
de construire le resume sonore k partir du premier couplet 
et du second refrain (entre t4 et ts) ou du refrain de fin 
(entre tg et t7) . Ainsi, les deux passages select ionnSs 
pour construire le r^sum^ sonore ne sont pas forcSment 
contigus . 
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Une concatenation aveugle de signaux sonores correspondant 
a deux parties d'un morceau de musique donne un ressenti 
dgsagrgable a I'oreille. On d^crit ci-apr^s, en reference 
aux figures 2, 3a, 3b et 4, la construction d'un signal 
sonore par concatenation de deux parties d'un morceau de 
' musique, de manidre a surmonter ce probl^me. 

L'un des buts de cette construction par concatenation est 
de preserver localement le tempo du signal sonore. 

Un autre but est d' assurer une distance temporelle entre 
points de concatenation (ou points ^' ^ alignsment") ggale a 
un multiple entier de la dur^e d'une mesure. 

Preferentiellement, cette concatenation s"effectue par^ 
superposition/addition de segments sonores choisis et 
isoies des deux parties respectives precitees du morceau 
de musique. 

On decrit ci-aprds une superposition/addition de tels 
segments sonores, dans un premier temps par 
synchronisation de beat (dite "heat-synchrone") . puis par 
synchronisation de mesure selon une realisation preferee. 

On note ci-apres : 

- bpm, le nombre de beats par minute d'un morceau de 
musique, 

- D, la reference de ce nombre bpm (par exemple dans le 
cas d'un morceau note »l20=noire^\ bpin=120 et 
D=i3oire) , 
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- la duree (exprimee en secondes) d'un beat, c^est- 
a-dire de la reference D : dans 1 ' exemple precedent 
ou D=iioire, on a 

bpm 

- N, le numerateur de la metrique du morceau de musique 

(par exemple, dans le cas d'line mesure not§e "3/4", 
N=3) , 

- M, la duree (exprimee en secondes) d'une mesure, 
donn^e par la relation M=N.T (soit M=3*60/120 dans 
1 ' exemple precedent) , 

- s(t), le signal audio d'un morceau de musique, 

- s{t) , le signal reconstruit par super- 
position/addition, et 

- Si(t) et Sj(t), les i^"'^ et j^™^ segments .qui 
comportent des signaux audio respectifs appartenant a 
un premier et & ixn second passage d»un morceau de 
musique, et qui sont utilises pour la construction de 
s{f) par superposition/ addition. 

En principe, les premier et second passages pr^cit^s ne 
sont pas contigus. s(t) est alors obtenu comme suit. 

En se referant a la figure 2, les segments si (t) et Sj (t) 
sont d^abord formes par decoupage du signal audio a l»aide 
d'une fenetre temporelle h^Ct) , de largeur L et definie 
(de valeur non nulle) entre 0 et L. Cette fenetre peut 
gtre de type rectangulaire, de type dit "de hanning" , de 
type dit "de harming en palier'' , ou autre. En se referant 
a la figure 4, un type pr^ferS de fenetre temporelle est 
obtenu par concatenation d*un flanc montant, d'un pallier 
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6t d'lon flanc descendant. La largeur temporelle prSfgrSe 
de cette fengtre est indiquSe ci-aprds. 

On definit alors le premier segment Si(t> de sorte que : 
oil mi est 1 • instant de dSbut du premier segment. 

Comme le montre la figure 3a, on construit Sj (t) 
sensiblement de la m§me mani^re : 

Sj(t) = s(t + mj)\(t) [Ibis] 
oil mj est 1' instant de dgbut du second segment. 

Mgme si la dur^e L de la fenetre temporelle est la m§me 
pour les deux segments, on indique toutefois que la forme 
de la fengtre peut gtre diff^rente d'un segment Si(t) k 
1' autre Sj (t) , comme le montre d'ailleurs la figure 2. ' 

Soit bi et bj deixx positions respectives a I'int^rieur des 
premier et second segments, appelges "positions de 
synchronisation", par rapport auxquelles s'effectue la 
superposition/addition, telles que : 

0 jS- bi ^ I, et 0 jS" jbj- jTI, [2] 

Avantageusement, la distance temporelle entre bi et bj est 
choisie ggale a un multiple entier de la duree T d'un beat 
(bj - bi = kT) . Dans ces conditions, on dit qu'il y a 
reconstruction "beat-synchrone" si 

s(.0 = J^Si'(t-(i-l).(k'T)+c) 

s'irt; = SiCt+bi; [5] 
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et ou k' est le plus grand entier tel que Jc'T < L- (bi-mj^) , 
c est une constante de temps telle que c = bi-mi. 
Avantageusement , la distance entre les instants mi et 
est choisie ggale h un multiple entier de k'NT, dans 
lequel N designe le num^rateur de la metrique, 

Ainsi, le signal reconstruit s'ecrit : 

On obtient alors une superposition/addition synchrone a la 
mesure. La figure 3b illustre cette situation • On remarque 
sur la figure 4 que la largeur L de la fenStre temporelle 
pr^cit^e est voisine de k'NT (a\ax f lanes montant et 
descendant pres) . Toutefois, on choisira 

preferential lament dans ce cas des rampes de f lanes telles 
que k'T < L-2 (hi-nii) . 

Plus particulierement , on choisit les instants nii et irij de 
sorte qu'ils correspondent a des premiers temps de 
mesures. Dans ces conditions, on obtient avantageusement 
une superposition/addition beat -synchrone dite ''alignSe^' , 

Ainsi, en determinant en outre la metrique du premier 
passage et/ou du second passage, on peut effectuer une 
reconstruction beat -synchrone S la mesure. Si, de plus, on 
choisit les premier et second segments de sorte qu'ils 
commencent par un premier temps de mesure, cette 
reconstruction beat -synchrone est align^e. 
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On indique qu'une reconstruction du signal s(t) peut §tre 
ttien^e sur la base de plus de deux passages musicaux a 
concat^ner. Pour i passages musicaux (i>2) , la 
generalisation du precede ci-avant s'exprime par la 
relation : 

m^Si\t + c) + s^\t-k,'T+c) + s^\t-k,'T + k^'T + c) + ... 

Chaque entier kj « est dgfini comma I'entier le plus grand 
tel que kj^T < Lj- (bj-mj) , ou Lj correspond a la largeur de 
la fenetre du jeme passage musical a concatener. 

On indique que les premiers temps de mesure, ou encore la 
mgtrique, ou encore le tempo d'vm morceau de musique, 
peuvent etre detectSs automatiquement , par exemple en 
utilisant des applications logicielles existantes. Par 
exemple, la norme MPEG-7 (Audio Version 2) prgvoit la 
determination et la description du tempo et de la metrique 
d'un morceau de musique, en utilisant de telles 
applications logicielles. 

Bien entendu, la prSsente invention ne se limite pas a la 
forme de realisation decrite ci-avant k titre d' exemple ; 
elle s'etend a d'autres variantes. 

Ainsi, on comprendra que le resume sonore peut comporter 
plus de deux passages musicaux, par exemple une 
introduction, un couplet et un refrain, ou encore deux 
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passages differents d'un couplet et d'un refrain, tels que 
1 * introduction et un refrain, par exexnple. 

On remarquera aussi que les Stapes representees sous forme 
d ' organigramrae sur la figure 5 peuvent §tre iraplSmentSes 
par un logiciel informatique dont 1 ' algorithme reprend 
globalement la structure de 1 ' organigramme . A ce titre, la 
pre sent e invention vise aussi un tel programme 
informatique . 
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Revendications 

1. Proced6 de traitement d'une sequence sonore, dans 
1 equal : 

a) on applique une transformee spectrale a ladite sequence 
pour obtenir des coefficients spectraux. variant en 
fonction du temps dans ladite sequence, 

caracterise en ce qu'il coTnporte en outre les 
Stapes suivantes : 

b) on determine, par analyse statistique desdits 
coefficients spectraux, au tnoins une sous -sequence r6p§t^e 
dans ladite sequence, et 

c) on evalue des instants de debut et de fin de ladite 
sous -sequence dans la sequence sonore. 

2. Proc6d^ selon la revendication 1, caractSris^ en ce 
qu'il coinporte en outre une ^tape : 

d) d» extraction de la sous-sequence pour stocker, dans une 
memoire, des echantillons sonores representant ladite 
sous - sequence . 

3. Procede selon la revendication 2, caracterise en ce que 
1' extraction de 1 ' etape d) concerne au moins une sous- 
sequence dont la duree est la plus importante et/ou tme 
sous-sequence dont la frequence de repetition est la plus 
importante dans ladite s^cjuence . 

4. Proc6d6 selon I'une des revendi cat ions 1 al 3, dans 
lec[uel la sequence sonore est un morceau de musique 
comportant une succession de sous -sequences partni au moins 
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une introduction, un couplet^ un refrain, un pont de 
transition, un theme, un motif, un raouvement, 

caract^rise en ce que, Bl l^^tape c) , on determine 
au moins les instants respect if s de debut et de fin d'une 
5 premiere sous-sequence et d'une seconde sous -sequence. 

5- Procede selon la revendication 4, prise en combinaison 
avec la revendication 3, caracterise en ce que la premiere 
sous -sequence correspond k un couplet et la seconde sous- 
10 sequence correspond a un refrain. 

6. Procede selon I'une des revendications 4 et 5, prises 
en combinaison avec la revendication 2, caracterise en ce 
que, a I'etape d) , on extrait une premiere et une seconde 
15 sous- sequence pour obtenir, sur un support memoire, un 
resume sonore dudit morceau de musique comportcLnt au moins 
la premiere sous-sequence enchainSe avec la seconde sous- 
sequence . 

20 7. Procede selon la revendication 6, dans lequel les 
extraits des sous -sequences sont non contigus dans le 
temps, caracterise en ce qu'il comporte en outre les 
e tapes suivantes : 

dl) detecter au moins une cadence de la premiere sous- 
25 sequence et/ou de la seconde sous -sequence pour estimer la 
duree moyenne d'une mesure a ladite cadence, ainsi qu^au 
moins un segment de fin de la premiere sous -sequence et au 
moins un segment de debut de la seconde sous -sequence, de 
durees respectives correspondant sensiblement a ladite 
30 duree moyenne et isoles dans la sequence d'un nombre 
entier de durees moyennes. 
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d2) gen^rer au moins une mesure de transition de dur^e 
correspondant a ladite duree moyenne et comport ant une 
addition des echantillons sonores d'au moins ledit segment 
de fin et d'au moins ledit segment de debut, 
d3) et concatener la premiere sous -sequence, la ou les 
mesures de transition et la seconde sous -sequence pour 
obtenir un enchainement de la premidre et de la seconde 
sous - sequence . 

8* ProcedS selon la revendication 7, caract6ris6 en ce que 
1 ' ^tape dl) coraporte un d^coupage en au moins deux 
fenStres, de type rectangulaire, de type de Hanning, de 
type de Hanning . en palier, ou pref erentiellement de type 
comportant un flanc montant, un pallier et un. • f lane 
descendant dans le temps, 

9. Procede selon I'une des revendications 7 ,.et 8, 
caracteris4 en ce que 1 ' etape d2) comporte une 
reconstruction beat-synchrone . 

10. Procede selon la revendication 9, caracterise en ce 
que, a I'^tape dl) , on determine en outre la metrique de 
la premiere sous -sequence et/ou de la seconde sous- 
s6quence, et en ce que 1 • etape d2) comporte une 
reconstruction beat-synchrone a la mesure. 

11. Precede selon I'une des revendications 9 et 10, 
caract6ris6 en ce que, S I'^tape dl) , on determine lesdits 
segments de fin et de d^but de sorte qu'ils commencent par 
un premier temps de mesure, et en ce que l'6tape d2) 
comporte \ine reconstruction beat-synchrone alignee. 
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12. Produit programme d'ordinateur, stocks dans une 
m^raoire d'ordinateur ou sur un support amovible propre a 
cooperer avec un lecteur d'ordinateur, caract^risg en ce 
qu'il comporte des instructions pour dSrouler les Stapes 
du procgdg selon I'une des revendi cat ions precedentes. 
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